声带煎炸或吱吱作响的声音是指以不规则的发光开口和低音为特征的语音质量。它以各种语言发生,并且在美国英语中很普遍,不仅可以标记词组结局,还用于社会语言因素和影响。由于其不规则的周期性,吱吱作响的声音挑战自动语音处理和识别系统,尤其是对于经常使用吱吱作响的语言。本文提出了一个深度学习模型,以检测流利的语音中的吱吱作响的声音。该模型由编码器和经过训练的分类器组成。编码器采用原始波形,并使用卷积神经网络学习表示。分类器被实现为多头完全连接的网络,该网络训练有素,可检测吱吱作响的声音,发声和音调,最后两个用于完善吱吱作响的预测。该模型经过对美国英语说话者的言语的培训和测试,并由训练有素的语音家注释。我们使用两个编码器评估了系统的性能:一个是为任务量身定制的,另一个是基于最新的无监督表示。结果表明,与看不见的数据相比,我们表现最佳的系统的回忆和F1得分有所改善。
translated by 谷歌翻译
The NASA Astrophysics Data System (ADS) is an essential tool for researchers that allows them to explore the astronomy and astrophysics scientific literature, but it has yet to exploit recent advances in natural language processing. At ADASS 2021, we introduced astroBERT, a machine learning language model tailored to the text used in astronomy papers in ADS. In this work we: - announce the first public release of the astroBERT language model; - show how astroBERT improves over existing public language models on astrophysics specific tasks; - and detail how ADS plans to harness the unique structure of scientific papers, the citation graph and citation context, to further improve astroBERT.
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
基于最近的现实语言建模(GPT-3)和跨模型表示(CLIP),GAUD \'我开发了帮助设计师使用自然语言搜索鼓舞人心的图像。在设计过程的早期阶段,目的是引出客户首选的创意方向,设计师通常会创建一个名为“情绪板”的鼓舞人心的图像的主题集合。创建情绪板涉及使用关键字或图像执行的顺序图像搜索。高德\'我这个转变过程中的谈话,其中用户正在逐步详细介绍了情绪板上的主题。此表示允许我们的AI从项目简报开始从PTPT-3假设的主题,从划线开始,从头开始生成新的搜索查询。与以前的电容委员会创作方法相比,据我们所知,我们的首次尝试将情绪板代表为设计人员何时向客户提出创意方向时讲述的故事。
translated by 谷歌翻译
高保真,基于AI的模拟课堂系统使教师能够排练有效的教学策略。但是,对话导向的开放式对话,例如教学关于规模因素的教学可能难以模仿。本文建立了一个基于文本的互动会话代理,以帮助教师根据着名的教学质量评估来练习数学质疑技能。我们采取了一种以人为本的设计来设计我们的系统,依靠深度学习,不确定量化和自然语言处理的进步,同时承认对会话代理的局限性进行特定的教学需求。在模拟期间直接使用专家输入,我们展示了如何实现谈话成功率和高用户满意度。
translated by 谷歌翻译
大型研究展示了教师质疑策略如何改善学生学习结果。然而,开发新方案是挑战,因为缺乏特定情景的培训数据以及与标签相关的成本。本文介绍了基于AI的高保真度,级教室模拟器,帮助教师排练基于研究的数学质疑技巧。使用人类循环方法,我们收集了一个高质量的训练数据集,用于数学质疑方案。利用最近的不确定性量化的进步,我们评估了我们的可用性的会话代理,并分析了纳入人类循环方法进行数据收集和系统评估的实用性,以获得数学质疑场景。
translated by 谷歌翻译
地球天气和气候的数值模拟需要大量的计算。这导致替换替换具有在推理时间快速的近似机器学习(ml)方法的子程序来替换的子程序感兴趣。在天气和气候模型中,大气辐射转移(RT)计算特别昂贵。这使他们成为了基于神经网络的仿真器的流行目标。然而,由于缺乏缺乏全面的数据集和ML基准测试的标准化最佳实践,事先工作难以比较。为了填补这个差距,我们建立一个大型数据集,比加拿大地球系统模型为基础的大型数据集,高于\ emph {1000万个样本,未来的气候条件}。 Climart为ML社区带来了几种方法论挑战,例如多次分发试验集,底层域物理学和准确性和推广速度之间的权衡。我们还提出了几种新颖的基线,这些基线表示现有工作中使用的数据集和网络架构的缺点。下载说明,基准和代码可提供:https://github.com/rolnicklab/climart
translated by 谷歌翻译
我们提供了PelficGridWorld软件包,为用户提供轻量级,模块化和可定制的框架,用于创建专注的电源系统的多代理体育馆环境,该环境易于与强化学习(RL)的现有培训框架集成。虽然存在许多框架用于训练多代理RL(MARL)政策,但没有可以快速原型并发开发环境,尤其是在所需电流解决方案来定义网格的异构(复合式,多器件)电力系统的背景下 - 级别变量和成本。 PowerGridWorld是一个开源软件包,有助于填补此间隙。为了突出PowerGridWorld的关键功能,我们展示了两个案例研究,并使用Openai的多代理深度确定性政策梯度(MADDPG)和RLLIB的近端策略优化(PPO)算法来演示MARL政策。在这两种情况下,至少一些代理子集合在每次作为奖励(负成本)结构的一部分中的一部分中的功率流溶液的元件。
translated by 谷歌翻译
面部签名,包括尺寸,形状,纹理,肤色,眼睛颜色,外观和疤痕/标记,被广泛用作访问控制的辨别性生物信息。尽管最近面部识别系统进步,但对面部识别系统的介绍遭到越来越复杂。检测演示攻击或欺骗尝试的能力是面部识别系统的完整性,安全性和信任的迫切问题。先前已经引入了多光谱成像作为通过利用对电磁谱的不同区域敏感的传感器来改善呈现攻击检测的方法(例如,可见,近红外,长波红外线)。虽然多光谱呈现攻击检测系统可以是歧视性的,但是对附加传感器和计算资源的需要显着增加了复杂性和成本。相反,我们提出了一种方法,该方法在训练期间从红外图像中利用了信息,以提高基于可见的呈现攻击检测系统的可怜的判断性。我们介绍(1)新的跨域呈现攻击检测框架,增加了仅使用可见光谱图像的BonaFide和呈现攻击的可分离性,(2)在优化跨域呈现攻击检测时增加训练稳定性的逆域正则化技术框架,和(3)一个密集的域适配子网,用于在可见和不可见域之间转换表示。
translated by 谷歌翻译
Designing experiments often requires balancing between learning about the true treatment effects and earning from allocating more samples to the superior treatment. While optimal algorithms for the Multi-Armed Bandit Problem (MABP) provide allocation policies that optimally balance learning and earning, they tend to be computationally expensive. The Gittins Index (GI) is a solution to the MABP that can simultaneously attain optimality and computationally efficiency goals, and it has been recently used in experiments with Bernoulli and Gaussian rewards. For the first time, we present a modification of the GI rule that can be used in experiments with exponentially-distributed rewards. We report its performance in simulated 2- armed and 3-armed experiments. Compared to traditional non-adaptive designs, our novel GI modified design shows operating characteristics comparable in learning (e.g. statistical power) but substantially better in earning (e.g. direct benefits). This illustrates the potential that designs using a GI approach to allocate participants have to improve participant benefits, increase efficiencies, and reduce experimental costs in adaptive multi-armed experiments with exponential rewards.
translated by 谷歌翻译